파이썬 머신러닝 완벽 가이드 02-04. Model Selection 모듈 소개 먼저, dataset을 K등분하고, 그 중 K-1개의 dataset을 학습 dataset으로, 나머지 1개의 dataset을 검증 dataset으로 하여 학습과 평가를 수행하며 학습과 검증 dataset이 중복이 되지 않도록하여 이 과정을 K번 반복한다. 따라서 Stratified K-fold는 K-fold가 label dataset이 원본 dataset의 label 분포를 학습/테스트 da... machine learning파이썬 머신러닝 완벽 가이드machine learning 04-04. 랜덤 포레스트 배깅(Bagging)의 대표적인 알고리즘은 랜덤 포래스트이다. 랜덤 포레스트는 앙상블 알고리즘 중 비교적 빠른 수행 속도를 가지며, 다양한 영역에서 높은 예측 성능을 보이고 있다. 랜덤 포레스트의 기반 알고리즘은 결정 트리이며, 결정 트리의 장점인 쉽고 직관적인 점을 그대로 가지고 있다. 랜덤 포레스트는 여러 개의 결정 트리 분류기가 전체 데이터에서 배깅 방식으로 각자의 데이터를 샘플링하여 ... machine learning파이썬 머신러닝 완벽 가이드machine learning 07-02. 군집 평가(Cluster Evaluation) 특정 데이터 포인트의 실루엣 계수 값은 해당 데이터 포인트와 같은 군집 내에 있는 다른 데이터 포인트와의 거리를 평균한 값 a(i)와 해당 데이터 포인트가 속하지 않은 군집 중 가장 가까운 군집과의 평균 거리 b(i)를 기반으로 계산된다. sklearn.metrics.silhouette_score(x, labels, metric='euclidean', sample_size=None, **kw... machine learning파이썬 머신러닝 완벽 가이드machine learning
02-04. Model Selection 모듈 소개 먼저, dataset을 K등분하고, 그 중 K-1개의 dataset을 학습 dataset으로, 나머지 1개의 dataset을 검증 dataset으로 하여 학습과 평가를 수행하며 학습과 검증 dataset이 중복이 되지 않도록하여 이 과정을 K번 반복한다. 따라서 Stratified K-fold는 K-fold가 label dataset이 원본 dataset의 label 분포를 학습/테스트 da... machine learning파이썬 머신러닝 완벽 가이드machine learning 04-04. 랜덤 포레스트 배깅(Bagging)의 대표적인 알고리즘은 랜덤 포래스트이다. 랜덤 포레스트는 앙상블 알고리즘 중 비교적 빠른 수행 속도를 가지며, 다양한 영역에서 높은 예측 성능을 보이고 있다. 랜덤 포레스트의 기반 알고리즘은 결정 트리이며, 결정 트리의 장점인 쉽고 직관적인 점을 그대로 가지고 있다. 랜덤 포레스트는 여러 개의 결정 트리 분류기가 전체 데이터에서 배깅 방식으로 각자의 데이터를 샘플링하여 ... machine learning파이썬 머신러닝 완벽 가이드machine learning 07-02. 군집 평가(Cluster Evaluation) 특정 데이터 포인트의 실루엣 계수 값은 해당 데이터 포인트와 같은 군집 내에 있는 다른 데이터 포인트와의 거리를 평균한 값 a(i)와 해당 데이터 포인트가 속하지 않은 군집 중 가장 가까운 군집과의 평균 거리 b(i)를 기반으로 계산된다. sklearn.metrics.silhouette_score(x, labels, metric='euclidean', sample_size=None, **kw... machine learning파이썬 머신러닝 완벽 가이드machine learning